语音

双人对话生成模型 MOSS 上线,支持零样本语音克隆

在语音生成这一领域,文本到语音(TTS)模型已经能够合成出高度清晰、音色动人的单人朗读语音,极大地推动了内容创作与人机交互的进步。然而,当我们试图将这项技术应用于一些更具动态和表现力的多人对话场景——如播客对话、影视配音或长篇叙事时,传统的单说话人 TTS 模

模型 语音 克隆 双人 moss 2025-11-13 17:47  2

小度发布“超能小度”多模态AI助手 数千万设备免费升级

11月13日,在百度世界大会“大模型如何重塑智能硬件新体验”分论坛上,小度科技正式推出全新升级的多模态AI智能助手——“超能小度”,并宣布实现全系、全量、全生态上线。此次升级覆盖所有已售出的小度设备,意味着数千万用户将无需更换硬件即可免费获得一次“智慧重生”,

语音 免费 模态 音箱 李莹 2025-11-13 18:15  2

要保密选科密:构建一个语音交流无泄密的信任社会

——商务谈判桌上,合伙人可畅聊核心战略而无需提防暗藏的录音设备;家庭书房里,人们能倾诉心底私语而不必担忧对话被恶意传播;公共空间中,朋友间的随性闲谈、职场人的工作交流,都能摆脱“言多必失”的顾虑。在这个信任社会里,语音作为最直接的沟通载体,不再是潜在的泄密隐患

语音 商业价值 社会 科密 商业机密 2025-11-13 16:12  2

麻省理工学院研究AI对话时机判断难题

这项由麻省理工学院的张凯伟、台湾大学的胡恩佩等多位研究者共同完成的研究发表于2025年9月,论文编号为arXiv:2509.26388v1。研究团队来自麻省理工学院、台湾大学以及台湾中央研究院,他们联手解决了一个困扰AI语音助手很久的问题:机器虽然知道说什么,

语音 研究 裁判 麻省理工学院 moshi 2025-10-31 22:15  5

语音厅不露脸歌手,歌声先于外表被看见

之前有刷到过00后老板大梁的视频,接着是刷到好多头部主播的视频,浅盘一下有:赵太阳,七月,崔十八,桥鹊,饶子,麦麦,徐来,旧情,萨满,野洵,六月,澈清,尹妹,堆堆,贤,张秋水,翔屿,北夜,冬眠,JS……(待你补充~

皮套 语音 歌手 萨满 听潮 2025-10-31 20:38  4